#구글 리서치

구글 SensorFM, 웨어러블 데이터를 건강 인텔리전스로

구글 리서치는 500만 명 이상의 방대한 웨어러블 기기 데이터를 사전 학습한 파운데이션 모델 'SensorFM'을 공개했습니다. 이 단일 모델은 수면, 심혈관 및 대사 건강 등 총 35개의 건강/행동 예측 작업 중 34개에서 기존 특화 모델들을 능가하는 성능을 입증했습니다. 이는 파편화된 기존 웨어러블 건강 기능을 통합하고, 막대한 라벨링 비용 없이도 개인화된 AI 건강 비서 구현의 핵심 기반이 될 수 있어 매우 중요합니다.

구글 리서치 파운데이션 모델 웨어러블

The Decoder • 46일 전

IMP 7

구글 '제미나이-SQL2', 텍스트투SQL 벤치마크 압도적 1위

구글 리서치가 자연어를 실행 가능한 SQL 쿼리로 변환하는 새로운 시스템인 '제미나이-SQL2(Gemini-SQL2)'를 공개했습니다. 이 모델은 자연어를 SQL로 변환하는 정확도를 측정하는 BIRD 벤치마크에서 80.04%의 실행 정확도를 기록하며 오픈AI, 앤스로픽 등 경쟁사들을 큰 차이로 제치고 압도적인 1위를 차지했습니다. 자연어 기반의 복잡한 데이터베이스 쿼리 생성 기술이 상용화 단계에 근접하고 있음을 보여주는 중요한 성과입니다.

구글 리서치 제미나이 데이터베이스

The Decoder • 115일 전

IMP 8

구글 연구: AI 평가, 인간의 의견 다양성 간과

구글과 로체스터 공과대학의 공동 연구에 따르면, AI 벤치마크에서 주로 사용하는 항목당 3~5명의 인간 평가자 수는 신뢰할 수 있는 결과를 도출하기에 부족합니다. 신뢰성 있는 평가를 위해서는 항목당 최소 10명 이상의 평가자가 필요하며, 전체 예산을 테스트 항목 수와 평가자 수에 맞게 전략적으로 분배하는 것이 필수적입니다.

AI 벤치마크 인간 평가 구글 리서치